Pour son premier LLM codeur ouvert, Mistral AI choisit une architecture alternative | Silicon

Clément Bohic - Silicon - 17/07

Pour développer une version 7B de son modèle Codestral, Mistral AI n'a pas utilisé de transformeur, mais l'architecture Mamba2.

À quand le support de Codestral Mamba dans llama.cpp ? Mistral AI invite à garder un œil sur l’évolution de cette demande.

L’usage en local est effectivement l’une des promesses de ce LLM « spécial code ». À environ 7 milliards de paramètres, il est plus petit que le modèle Codestral 22B disponible depuis quelques semaines. Il s’en distingue aussi pa...
[Courte citation de 8% de l'article original]

Tags : mistral ai - chatgpt -

Source et Copyright images et textes : Clément Bohic - Silicon
Lien original, consulter l'article dans son intégralité ici : https://www.silicon.fr/codestral-mamba-mistral-ai-480569.html
Lien direct sur notre site : http://www.newsexplorer.fr/article/19911555/Pour-son-premier-LLM-codeur-ouvert--Mistral-AI-choisit-une-architecture-alternative-|-Silicon
Partager : Facebook - Twitter

Avis de non-responsabilité pour les articles et les traductions :
Les articles publiés sur ce site ont été rédigés par des auteurs externes et ne représentent pas l'avis ou les opinions de ce site. Les informations contenues dans ces articles sont fournies à titre indicatif et ne doivent pas être considérées comme des conseils professionnels ou juridiques.
De plus, les traductions proposées sur ce site peuvent ne pas être exactes ou complètes. Nous ne pouvons garantir l'exactitude, la fiabilité ou la pertinence de ces traductions et nous déclinons toute responsabilité pour toute perte ou préjudice causé par leur utilisation.
Nous recommandons à nos lecteurs de vérifier toutes les informations avant de prendre des décisions ou d'entreprendre des actions en se basant sur ces articles ou traductions. Nous ne serons pas tenus responsables des erreurs ou des omissions dans les informations fournies sur ce site.